我们描述了Fink Broker早期SuperNova IA分类器如何通过采用主动学习(AL)策略来优化其ML分类。我们展示了当前Zwicky瞬态设施(ZTF)公共警报数据流执行此类策略的可行性。我们比较两个AL策略的表现:不确定性采样和随机抽样。我们的管道由3个阶段组成:功能提取,分类和学习策略。从10个警报的初始样本开始(5个SN IA和5个非IA),我们让算法识别应将哪个警报添加到训练样本中。允许系统演变为300次迭代。我们的数据集由ZTF的23 840警报组成,通过与Simbad数据库的交叉匹配和瞬态名称服务器(TNS),其中1 600个是SNE IA(1 021独特对象)的确认分类。在学习周期完成后,数据配置由310个警报进行培训和23 530进行测试。平均超过100种实现,分类器实现了89%的纯度和54%的效率。从01/11月/ 2020年至10月31日/ 10月/ 2021年Fink已将早期的Supernova IA模块应用于ZTF流,并向TNS传达有希望的SN IA候选人。从535个光谱分类的粉末候选者,459名(86%)被证明是SNE IA。我们的成果证实了积极学习策略的有效性,以指导天文分类器的最佳训练样品的构建。它在实际数据中展示了学习算法的性能可以高度改善,而无需额外的计算资源或压倒性大型训练样本。这是我们的知识,第一次应用Al到真实警报数据。
translated by 谷歌翻译
基于全注意力的变压器体系结构的强大建模能力通常会导致过度拟合,并且 - 对于自然语言处理任务,导致自动回归变压器解码器中隐式学习的内部语言模型,使外部语言模型的集成变得复杂。在本文中,我们探索了放松的注意力,对注意力的重量进行了简单易于实现的平滑平滑,从编码器。其次,我们表明它自然支持外部语言模型的整合,因为它通过放松解码器中的交叉注意来抑制隐式学习的内部语言模型。我们证明了在几项任务中放松注意力的好处,并与最近的基准方法相结合,并明显改善。具体而言,我们超过了最大的最大公共唇部阅读LRS3基准的26.90%单词错误率的先前最新性能,单词错误率为26.31%,并且我们达到了最佳表现的BLEU分数37.67在IWSLT14(de $ \ rightarrow $ en)的机器翻译任务没有外部语言模型,几乎没有其他模型参数。代码和模型将公开可用。
translated by 谷歌翻译
可以使用X射线自由电子激光器的强脉冲和短脉冲直接通过单次相干衍射成像直接观察到自由飞行中孤立的纳米样品的结构和动力学。广角散射图像甚至编码样品的三维形态信息,但是该信息的检索仍然是一个挑战。到目前为止,只有通过与高度约束模型拟合,需要对单镜头实现有效的三维形态重建,这需要有关可能的几何形状的先验知识。在这里,我们提出了一种更通用的成像方法。依赖于允许凸多面体描述的任何样品形态的模型,我们从单个银纳米颗粒中重建广角衍射模式。除了具有高对称性的已知结构动机外,我们还检索了以前无法访问的不完美形状和聚集物。我们的结果为单个纳米颗粒的真实3D结构确定以及最终的超快纳米级动力学的3D电影开辟了新的途径。
translated by 谷歌翻译
在这项工作中,我们介绍了患者生成的含量中第一个用于德国不良药物反应(ADR)检测的语料库。该数据包括来自德国患者论坛的4,169个二进制注释的文档,用户谈论健康问题并从医生那里获得建议。正如该领域的社交媒体数据中常见的那样,语料库的类标签非常不平衡。这一主题不平衡使其成为一个非常具有挑战性的数据集,因为通常相同的症状可能会有几种原因,并且并不总是与药物摄入有关。我们旨在鼓励在ADR检测领域进行进一步的多语性努力,并使用基于多语言模型的零和少数学习方法为二进制分类提供初步实验。当对XLM-Roberta进行微调首先在英语患者论坛数据上,然后在新的德国数据上进行微调时,我们的正面级别的F1得分为37.52。我们使数据集和模型公开可供社区使用。
translated by 谷歌翻译
已经提出了许多基于神经内容的新闻建议的模型。但是,对此类系统的三个主要组成部分(新闻编码器,用户编码和评分功能)和所涉及的权衡的相对重要性的了解有限。在本文中,我们评估了以下假设:匹配用户和候选新闻表示的最广泛使用的方法不够表达。我们允许我们的系统通过评估更具表现力的评分功能来建模两者之间的更复杂的关系。在广泛的基线和建立的系统中,这会导致AUC中约6分的一致改进。我们的结果还表明,新闻编码器的复杂性与评分功能之间的权衡:一个相当简单的基线模型在思维数据集中得分远高于68%的AUC,并且在已发布的最新艺术品的2点范围内,而同时也是如此。需要一小部分计算成本。
translated by 谷歌翻译
超新星(SNE)是宇宙中最亮的物体之一,是标志着恒星一生末尾的强大爆炸。超新星(SN)类型是由光谱发射线定义的,但是获得光谱法在逻辑上通常是不可行的。因此,仅使用时间序列图像数据鉴定SNE的能力至关重要,尤其是鉴于即将到来的望远镜的广度和深度的增加。我们提出了一种用于快速超新星时间序列分类的卷积神经网络方法,观察到的亮度数据在波长和时间方向上都通过高斯过程回归平滑。我们将此方法应用于完整的持续时间和截断的SN时间序列,以模拟回顾性和实时分类性能。回顾性分类用于区分宇宙学上有用的IA SNE与其他SN类型的类型,并且此方法在此任务上的准确性> 99%。我们还能够在只有两个晚上的数据和98%的准确度回顾性的情况下以60%精度区分6种SN类型。
translated by 谷歌翻译
从语言学习者到残疾人,文本可读性评估对不同目标人士有广泛的应用。网络上文本内容生产的快速速度使得如果没有机器学习和自然语言处理技术的好处,就无法测量文本复杂性。尽管各种研究涉及近年来英语文本的可读性评估,但仍有改进其他语言的模型的空间。在本文中,我们提出了一种基于转移学习的德语文本评估文本复杂性评估的新模型。我们的结果表明,该模型比从输入文本中提取的语言特征优于更多经典的解决方案。最佳模型是基于BERT预训练的语言模型,达到了均方根误差(RMSE)为0.483。
translated by 谷歌翻译
背景:在信息提取和自然语言处理域中,可访问的数据集对于复制和比较结果至关重要。公开可用的实施和工具可以用作基准,并促进更复杂的应用程序的开发。但是,在临床文本处理的背景下,可访问数据集的数量很少 - 现有工具的数量也很少。主要原因之一是数据的敏感性。对于非英语语言,这个问题更为明显。方法:为了解决这种情况,我们介绍了一个工作台:德国临床文本处理模型的集合。这些模型接受了德国肾脏病报告的识别语料库的培训。结果:提出的模型为内域数据提供了有希望的结果。此外,我们表明我们的模型也可以成功应用于德语的其他生物医学文本。我们的工作台公开可用,因此可以开箱即用,或转移到相关问题上。
translated by 谷歌翻译
本文介绍了深度学习体系结构的设计,这些设计允许对两个人行走的人之间存在的社会关系分为四个可能的类别 - 相交,夫妇,家庭或友谊。这些模型是使用神经网络或经常性神经网络开发的,以实现分类,并使用从人类在城市环境中执行伴奏过程的读数数据库进行培训和评估。最佳实现的模型在分类问题中实现了相对良好的准确性,其结果可部分增强先前研究的结果[1]。此外,提出的模型显示了提高其效率并将在真正的机器人中实施的未来潜力。
translated by 谷歌翻译
以人为中心的可解释人工智能(HCXAI)社区提出了将解释过程作为人与机器之间的对话进行构建。在该立场论文中,我们为基于文本的对话剂建立了Desiderata,能够使用自然语言进行交互方式解释神经模型的行为。从自然语言处理(NLP)研究的角度来看,我们设计了这种调解人的蓝图,以进行情感分析的任务,并评估当前的研究在基于对话的解释方面走上了多远。
translated by 谷歌翻译